# 数据来源：https://www.kaggle.com/starbucks/store-locations/data
# 现在我们有一组关于全球星巴克店铺的统计数据，如果我想知道
# 美国的星巴克数量和中国的哪个多，
# 或者我想知道中国每个省份星巴克的数量的情况，那么应该怎么办？

 # 思路：遍历一遍，每次加1 ？？？

import pandas as pd
from matplotlib import pyplot as plt

file_path='./starbucks_store_worldwide.csv'
df = pd.read_csv(file_path)

# print(df.head())
# print(df.info())
# 发现国家和省份的信息都是完整的

# 取出国家，对国家进行分组，设置zeros，进行统计
country_series = df['Country']

# print(country_series.head())
# country_list = list(country_series.values)
# print(country_series.values)

# print(type(country_series.value_counts()))
# country_series.sort_values
# country_series.plot
country_counts = country_series.value_counts()
# print(country_counts.head())                              #这里选值大于30是为了画图好看
country_counts = country_counts.sort_values(ascending=False)[country_counts.values>30]

# 画图 条形图
plt.figure(figsize=(20,15), dpi=80)
# plt.bar(len(country_counts.index),country_counts.values)
_x = list(range(len(country_counts.index)))
_y = country_counts.values
plt.barh(_x,_y,height=0.8)
plt.yticks(_x,country_counts.index)
plt.show()

